Інформація про новину
  • Переглядів: 7022
  • Дата: 14-03-2021, 14:15
14-03-2021, 14:15

1. Кодування даних

Категорія: Інформатика





Попередня сторінка:  5.1. Опрацювання мультимедійних об’єкт...
Наступна сторінка:   2. Апаратне забезпечення комп’ютера

Зміст

 

1. Що означає «опрацювання даних»?

2. Що таке кодування повідомлень та для чого воно потрібне?

3. Які особливості має двійкове кодування?

4. Як кодуються в комп’ютері текстові повідомлення?

5. Як визначити довжину двійкового коду повідомлення?

6. Як кодують графічні дані?

 

Пригадайте:

  • як пов’язані між собою поняття інформація, повідомлення, дані;
  • способи подання повідомлень;
  • пристрої для роботи з даними.

 

Ви дізнаєтесь:

  • що означає «опрацювання даних»;
  • що таке кодування повідомлень та для чого воно потрібне;
  • які особливості має двійкове кодування;
  • як кодуються в комп’ютері текстові повідомлення;
  • як визначити довжину двійкового коду повідомлення;
  • як кодують графічні дані.

1. Що означає «опрацювання даних»?

 

Людина постійно отримує, шукає, зберігає і передає повідомлення, коли пізнає навколишній світ і спілкується. Відомості, зафіксовані на деякому носії, перетворюються в дані. З повідомленнями та даними вона може виконувати різні дії залежно від поставленої мети. Такі дії називають інформаційними процесами (мал. 1.1).

Серед інформаційних процесів тільки один процес передбачає отримання нових даних з наявних. Це відбувається під час їх опрацювання.

Опрацювання даних — це інформаційний процес отримання нових даних з наявних.

Наприклад, опрацьовуючи дані про кількість захворювань населення на Covid-19, можна зробити висновок про тенденцію (зростання чи спадання) захворюваності та порівняти з рівнем захворюваності в інших країнах (мал. 1.2).

А виконуючи обчислення над вхідними даними в поставленій задачі, ми отримуємо нові дані — розв’язок. Наприклад, маючи покази термометра (за Цельсієм) в Україні, можна отримати дані про цю ж температуру (за Фаренгейтом) у СТТТА. Для цього використовують формулу переводу градусів Цельсія в градуси Фаренгейта:

 

2. Що таке кодування повідомлень та для чого воно потрібне?

Повідомлення можна подати текстовим, графічним, звуковим способами, а також за допомогою відео, жестами та декількома способами одночасно — комбінованим повідомленням. Для подання усних повідомлень ми використовуємо мову. А будь-яке письмове повідомлення складається з набору різних знаків (символів), які належать певному алфавіту. Наприклад, для подання числових даних використовують алфавіт, що складається з 11 знаків: цифр 0-9 і десяткової коми для розділення цілої та дробової частини в десятковому дробі. Використання пристроїв для подання повідомлень зумовлює необхідність використання спеціальних знаків.

Код — це система правил для перетворення повідомлень, що містять текст, звук, зображення, жести тощо.

Кодування повідомлень — це процес перетворення за певними правилами одного подання набору даних в інше. Під час кодування повідомлення відбувається зміна вигляду повідомлення без зміни його змісту.

Для кодування повідомлень римський полководець Юлій Цезар придумав власний шифр. У ньому кожну літеру слова замінювали на ту, яка в алфавіті зсунута на деяке число-ключ.

У процесі обміну повідомленнями ми здійснюємо дві операції: кодування і декодування. Перша пов’язана з переходом від вихідної форми подання повідомлення у форму, яка є зручною для збереження, передавання або опрацювання. А друга — зі зворотним переходом до вихідного подання повідомлення.

Процес прийому й передавання повідомлень можна зобразити схемою (мал. 1.3).

Кодування і декодування належать до процесу опрацювання повідомлень, який можна здійснювати за допомогою комп’ютера.

Вправа 1. QR-код.

Завдання. Створіть QR-код із фрагментом вірша улюбленого українського поета чи поетеси. Завантажте код і запропонуйте його комусь у класі, щоб можна було відгадати автора чи авторку поезії.

1. Відкрийте вікно браузера. У рядку пошуку задайте пошуковий запит: створити QR-код безкоштовно.

2. У списку доступних сервісів оберіть один з них, наприклад:

3. Ознайомтеся з інтерфейсом сервісу. Визначте, на який вміст за допомогою цього сервісу можна створити QR-код.

4. Оберіть вміст: текст. Введіть фрагмент поезії обсягом відповідно до встановлених обмежень.

5. Завершіть створення коду. Завантажте зображення коду та збережіть файл з іменем Прізвище_Код у своїй структурі папок.

6. За можливості роздрукуйте його або розмістіть файл у спільній папці класу.

7. Установіть на смартфон програму для зчитування QR-кодів або скористайтесь установленою. Розкодуйте інформацію в QR-коді, який створено кимось у класі, просканувавши зображення коду. Якщо автор вам не відомий, то застосуйте інструмент пошуку під текстом.

8. Зробіть висновок про інформаційні процеси, що застосовані під час виконання даного завдання.

 

3. Які особливості має двійкове кодування?

 

Повідомлення можуть кодуватися різними способами. Вибір способу кодування залежить від виду повідомлення, яке необхідно кодувати: текст, число, графічне зображення або звук чи відео. Для опрацювання за допомогою комп’ютера повідомлення подаються (кодуються) у вигляді послідовностей електричних або магнітних сигналів двох видів. Кожний сигнал одного виду умовно позначають цифрою 0, а іншого виду — 1.

Кодування повідомлень з використанням двох сигналів називається двійковим. Набір даних, що отримується в результаті двійкового кодування, називається двійковим кодом.

Двійковий код використовують у двійковій системі числення. Ця система числення є позиційною, її база дорівнює двом і використовує для запису чисел тільки два символи: зазвичай 0 (нуль) та 1 (одиницю). Числа, представлені в цій системі, часто називають двійковими, або бінарними, числами. Для запису числа у двійковій системі числення використовують подання цього числа за допомогою степенів числа 2. Наприклад,

Зверніть увагу, що в записі нижній індекс позначає систему числення.

Переведення числа з десяткової системи числення у двійкову відбувається послідовним діленням з остачею (мал. 1.4).

Цифра 0 або 1 у двійковому коді повідомлення називається біт (англ. binary digit — двійкова цифра).

Однією з двох цифр 0 або 1 можна закодувати, наприклад:

• правильність твердження: неправильно (0) або правильно (1);

• стан вимикача: вимкнено (0) або ввімкнено (1) тощо.

З двох бітів можна скласти 4 (4 = 22) коди (00, 01, 10 і 11). Ними можна закодувати, наприклад, чотири чверті координатної площини: 00 — ліва верхня, 01 — права верхня, 10 — ліва нижня, 11 — права нижня.

З трьох бітів можна скласти вже 8 (8=23) кодів (000, 001, 010, 011, 100, 101, 110, 111). Ними можна закодувати, наприклад, сторони горизонту (мал. 1.5).

Із чотирьох бітів можна скласти 24 = 16 кодів, з п’яти — 25 * * = 32 коди і т. д.

З восьми бітів можна скласти 28 = 256 кодів, і цієї кількості кодів достатньо, щоб закодувати всі літери англійського та українського (або якогось іншого) алфавіту, арабські цифри, розділові знаки, знаки арифметичних дій, а також деякі інші символи.

Послідовність із восьми бітів називається байтом.

Таблиця степенів числа 2 демонструє кількість можливих різних повідомлень, які можна закодувати за допомогою відповідної кількості бітів:

 

4. Як кодуються в комп’ютері текстові повідомлення?

 

Традиційно для кодування одного символу використовують двій

ковий код, довжина якого дорівнює 1 байту, тобто 1 символ = 1 байт

= 8 бітів. Тоді можна обчислити, яку кількість різних символів можна

закодувати: N = 28 = 256. Така кількість символів є цілком достатньою

для подання текстових повідомлень, включаючи великі та малі літери українського й латинського алфавітів, цифри, знаки, графічні символи тощо. Кодування полягає в тому, що кожному символу ставиться у відповідність унікальний десятковий код від 0 до 255 або відповідний йому двійковий код від 00000000 до 11111111.

Користувач натискає на клавіатурі клавішу з символом, і в комп’ютер надходить певна послідовність із восьми електричних імпульсів (двійковий код символу). Код символу зберігається в оперативній пам’яті комп’ютера, де займає один байт. У процесі виведення символу на екран комп'ютера проводиться зворотний процес — декодування, тобто перетворення коду символу в його зображення.

Коди символів зберігаються у спеціальній таблиці. Кодова таблиця встановлює відповідність між символами і їх двійковими кодами для подання текстових даних у комп’ютері. Для того щоб весь світ однаково кодував текстові дані, потрібні єдині таблиці кодування.

У всьому світі за стандарт прийнято таблицю ASCII (American Standard Code for Information Interchange — Американський стандартний код для обміну повідомленнями). Створена в 1963 р. система кодування ASCII передбачала кодування 128 символів, коди яких складалися із 7 бітів (27 = 128). Із часом кодування було розширене до 256 символів (28 = 256), при цьому коди перших 128 символів не змінилися.

Система кодування ASCII (табл. 1.1) складається з базової (значення кодів від 0 до 31) і розширеної (значення кодів від 32 до 255) таблиць. Коди з 33 по 127 є інтернаціональними й відповідають символам латинського алфавіту, цифрам, знакам арифметичних операцій і

знакам пунктуації. Коди зі 128 по 255 є національними, тобто в національних кодуваннях тому самому коду відповідають різні символи.

У світі існують й інші системи кодування. У різних таблицях кодування ті само символи можуть мати різні коди. Останнім часом серед таблиць кодування, які містять українські літери, найпоширенішими є КОІ8Ш і Windows-1251. Довжина коду кожного символу в них — 1 байт.

Широкого поширення набув міжнародний стандарт Unicode — Unicode Consortium (UTF 32, UTF 16 і UTF 8), який відводить на кожний символ не один байт, а два, тобто 16 бітів, тому за його допомогою можна закодувати не 256, а 216 = 65 536 різних символів.

Вправа 2. Таблиця Unicode.

Завдання. Закодуйте за таблицею Unicode слово peace. Запишіть розв’язок у текстовий документ. Збережіть його з іменем СловоПрі-звище у своїй структурі папок.

1. Відкрийте текстовий процесор і створіть документ з іменем СловоПрізвище.

2. У головному меню операційної системи оберіть програму Таблиця символів.

3. У вікні, що відкриється, встановіть додаткові параметри перегляду (мал. 1.6).

4. Послідовно обирайте літери слова та в нижній частині вікна визначайте код літери. Записуйте відповідний код у текстовий документ.

5. Збережіть файл.

 

5. Як визначити довжину двійкового коду повідомлення?

 

Довжина двійкового коду текстового повідомлення — це кількість бітів чи байтів у двійковому коді цього повідомлення.

Для позначення довжин двійкового коду повідомлень використовують і більші одиниці вимірювання, які, згідно з Міжнародною системою одиниць (СІ), утворюються за допомогою префіксів кіло-, мега-, гіга-, тера- і т. д. Історично склалося так, що ці префікси (кіло-, мега-, гіга-, тера-) в інформатиці трактувалися інакше, не так, як, наприклад, у математиці, і мають у своїй основі степені числа 2, а саме:

Щоб перевести біти в байти, треба число бітів поділити на 8. Наприклад: 32 біти — це 4 байти. Щоб перевести байти в кілобайти, треба число байтів поділити на 1024. Наприклад: у 2048 байтах буде 2 кілобайти. І так далі за наступними одиницями вимірювання.

Щоб перевести байти в біти, треба число байтів помножити на 8. Наприклад: у 3 байтах буде 24 біти.

Щоб перевести кілобайти в байти, треба число кілобайтів помножити на 1024. Наприклад: у 3 кілобайтах буде 3072 байти й відповідно 24 576 бітів.

Щоб обчислити довжину двійкового коду повідомлення, треба кількість символів у тексті помножити на кількість бітів, потрібних для кодування одного символу. Наприклад: двійкове число 01010111 займає в пам’яті 8 бітів. Якщо його записати у вигляді тексту в кодуванні ASCII, довжина коду буде 8 байтів, або 64 біти, оскільки кожний символ кодується за допомогою 8 бітів. Довжина двійкового коду цього ж тексту в кодуванні Unicode становитиме 16 байтів, або 128 бітів.

Не слід забувати, що пропуски треба теж вважати за символи, оскільки вони також набираються на клавіатурі, мають свій код і зберігаються в пам’яті.

Вправа 3. Довжина двійкового коду тексту.

Завдання. Книжка містить 150 сторінок, на кожній сторінці — 40 рядків, у кожному рядку — 60 символів (включаючи пропуски). Знайдіть довжину двійкового коду тексту книжки, якщо для кодування кожного символу використано 8 бітів.

Розв'язання. Обчислимо кількість символів у книжці: 60 • 40 • 150 = = 360 000 (символів).

Оскільки довжина двійкового коду 1 символу — 8 біт = 1 Б, то довжина двійкового коду книжки дорівнює 360 000 Б.

Переведемо байти в більші одиниці: 360 000 Б : 1024 = 351,56 кБ 351,56 кБ : 1024 = 0,34 МБ.

Вправа 4. Перекодування.

Завдання. Автоматичний пристрій здійснив перекодування текстового повідомлення довжиною 48 символів, спочатку записаного в 7-біт-ному коді ASCII, в 16-бітне кодування Unicode. Визначте, на скільки збільшилася довжина двійкового коду повідомлення.

Розв'язання. Зміна кодування з 7 бітів на 16 бітів збільшує довжину коду кожного символу на 16 - 7 = 9 біт. Оскільки повідомлення містить 48 символів, то його обсяг збільшився на 48 • 9 = 432 (біта). Переведемо біти у байти: 432:8 = 54 (Б).

Вправа 5. Модем.

Завдання. Визначте, скільки часу модем, що працює зі швидкістю 1200 біт / с, буде передавати дані десяти сторінок тексту з 40 рядків по 80 символів у рядку.

Розв'язання. Обчислимо загальну кількість символів на сторінці. Це 40 • 80 = 3200 (символів).

Оскільки в кодуванні ASCII один символ має довжину коду 1 Б, загальна довжина двійкового коду даних на сторінці — 3200 Б. Переведемо 3200 Б в біти, оскільки швидкість модема вказана в біт / с. Отримаємо 3200 Б = 25 600 біт.

Розділимо 25 600 біт на 1200 біт / с, отримаємо 21,33 с. Таким чином, 10 сторінок тексту будуть передані за 213,3 с, або 3 хв 33,3 с.

Вправа 6. Кодування вебсторінок.

Завдання. Дослідіть, як зміняться текстові дані на головній сторінці вебпорталу Бібліотека української літератури (

http://www.ukriib.com

. ua/), якщо змінити систему кодування, що використана під час її створення.

1. Відкрийте вікно браузера, наприклад, GoogieChrome. У полі адреси введіть адресу вебпорталу Бібліотека української літератури (

http://www.ukriib.com.ua/

). Перегляньте, чи правильно відображаються текстові написи на сторінці.

2. Натисніть кнопку налаштування і керування браузером. Оберіть у меню, що відкрилося, вказівку Інші інструменти/Кодування (мал.1.7).

3. Послідовно обирайте систему кодування з меню, що відкрилося. Зробіть висновок, яка із систем кодування, окрім системи Windows-1251, правильно відображає вміст вебсторінки.

 

6. Як кодують графічні дані?

 

Розрізняють два основні методи створення і кодування графічних зображень: растровий і векторний.

Векторний малюнок складається з переліку об’єктів і наданих їм властивостей, зокрема форми, місця розміщення, розміру, контуру, вмісту. Усі ці властивості мають свій цифровий код.

Растрове зображення складається з точок — пікселів відповідних кольорів і нагадує аркуш паперу в клітинку, на якому кожна клітинка зафарбована певним кольором. Для кожного пікселя такого зображення вказують координату і колір. Під час кодування для прямокутного растра характеристикам кожного пікселя ставиться у відповідність цифровий код. Обсяг файлу, що містить растрове графічне зображення, — це переважно добуток розмірів (кількість пікселів за шириною і висотою) цього зображення на глибину кольору — кількість бітів, що необхідна для кодування кольору пікселя.

Найпоширеніший спосіб кодування кольору — RGB (від англ. Red, Green, Blue — червоний, зелений, синій). Використовується під час відображення зображення на екрані монітора комп’ютера чи телевізора, демонстрації презентацій, відеофрагментів, графіки (мал.1.8).

Будь-який колір можна отримати внаслідок зміни яскравості основних кольорів — червоного, зеленого та синього. У моделі RGB кожний з основних кольорів може набувати значень від 0 до 255. Наприклад, RGB (255,0,0) відображатиметься як червоний, оскільки параметр червоного кольору задано його найбільшим значенням, а інші дорівнюють 0.

Вправа 7. Кількість кольорів.

Завдання. Для зберігання фото на сайті соціальної мережі пропонують завантажити зображення розміром 32x64 пікселі обсягом 2 кБ. Визначте, скільки кольорів можна використати при цьому.

Розв’язання.

1. Визначимо кількість пікселів у зображенні: 32 • 64 = 21 * * * 5 • 26 * = 211 (точок).

2. Визначимо обсяг файлу: 2кБ = 2 • 210 = 211 Б.

3. Визначимо обсяг байтів на одну точку: 211 Б : 211 точок = 1 Б = 8 бітів.

4. Висновок: кількість кольорів = 28 = 256 (кольорів).

1. Обговоріть, який інформаційний процес відбувається у поданих

ситуаціях:

• лікарка на основі аналізу крові визначає діагноз захворювання

пацієнта;

• бухгалтер на основі даних про виробіток працівника нараховує

заробітну плату;

• метеорологиня на основі даних про стан довкілля прогнозує

погоду на наступний день;

• хімік на основі даних хімічного рівняння визначає результат хімічної реакції.

Наведіть власний приклад подібної ситуації, що реалізує визначений вами інформаційний процес.

2. Запропонуйте одне одному текстове повідомлення, закодоване за допомогою однієї із систем кодування. Хтось подає придумане повідомлення, використовуючи таблицю Unicode, інший чи інша — Windows-1251.

Перевірте правильність кодування. Для цього обміняйтесь кодами та декодуйте повідомлення. Визначте довжину двійкового коду кожного з повідомлень. Зробіть висновок.

3. Створіть у табличному процесорі таблицю переведення одиниць довжини двійкового коду повідомлення в такому вигляді:

Запропонуйте одне одному та перевірте на практиці інші таблиці переведення, наприклад, кілобайтів у біти, байти, мегабайти, гігабайти, терабайти. Обговоріть, як при цьому будуть змінюватись формули в клітинках електронної таблиці.

4. На сайті

https://ornament.name/creator#

запропоновано таблицю кодів для літер української абетки. її можна використати для створення орнаментів вишивання. Наприклад, для слова ВОЛЯ отримано орнамент.

Поясніть, який спосіб кодування графічних зображень використано. Запропонуйте свої варіанти «вишивання» цього слова.

5. Створіть власний спосіб кодування даних. Презентуйте його в класі. Поясніть, кому такий спосіб кодування може бути корисним.

6. Дослідіть, які дані можна отримати зі штрихкоду товару. Які дані мають бути на штрихкоді, щоб взяти участь в акції з підтримки вітчизняних товаровиробників «Купляймо українське». Складіть листівку-довідник з питань придбання товарів.

7. Перевірте, чи правильно записано рівності, якщо нижній індекс позначає систему числення:

Виконайте відповідні обчислення.

8. Автоматичний пристрій здійснив перекодування текстового повідомлення українською мовою, спочатку записаного в 16-бітному коді Unicode, у 8-бітне кодування КОІ-8. При цьому довжина двійкового коду повідомлення зменшилася на 480 біт. Скільки символів містить повідомлення?

9. Довжина двійкового коду текстового повідомлення, підготовленого за допомогою комп’ютера, становить 3,5 кБ. Скільки символів містить цей текст? Чи достатньо даних має задача, щоб можна було дати однозначну відповідь?

10. Відомо, що на кожній сторінці документа — 128 рядків, що містять по 48 символів кожний. Скільки сторінок у документі, якщо довжина його двійкового коду становить 720 кБ, за умови, що кожний символ кодувався 2-байтовим кодуванням Unicode?

11. Довжина двійкового коду текстового повідомлення становить 8192 біти. Виразіть це значення в кілобайтах.

12. Довжина двійкового коду текстового повідомлення становить 2 097 152 Б. Виразіть це значення в мегабайтах.

 

 

Це матеріал з підручника Інформатика 8 клас Морзе, Барна (2021)

 




Попередня сторінка:  5.1. Опрацювання мультимедійних об’єкт...
Наступна сторінка:   2. Апаратне забезпечення комп’ютера



^